热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

可汗|鲜肉_机器学习/深度学习入门资料汇总

篇首语:本文由编程笔记#小编为大家整理,主要介绍了机器学习/深度学习入门资料汇总相关的知识,希望对你有一定的参考价值。作者:刘才权

篇首语:本文由编程笔记#小编为大家整理,主要介绍了机器学习/深度学习入门资料汇总相关的知识,希望对你有一定的参考价值。


作者:刘才权


编辑:栾志勇




经常被同学和朋友询问机器学习或深度学习入门,有哪些不错的参考资料。老实讲,这个问题在网上随便一搜就是一大把的答案。我自己在最开始的时候也有同样的困惑,同样在搜索引擎和论坛里翻找答案。但大多数答案并不怎么让人满意:搜索结果要么星稀零散,只见树木不见森林;要么过于详尽,让人无从下手(很多资料作者自己都没看过)。


在这篇文章里,我把自己在学习过程中的参考资料进行了梳理。一方面,希望能给你一个相对系统的学习路线参考;另一方面,自己真实的实践经历,遇过坎,掉过坑,希望能给正准备入门的同学更多真实的借鉴。



入门视频

机器学习


很多人会推荐吴恩达在斯坦福的公开课CS229,但对于初学的同学来说,我觉得并不适合。虽然Andrew在课的最开始就说了,他的这门看更侧重于实践。但真实情况是,里面有太多的数学推导和证明。直接使用这门课来入门,对初学的同学来说,在信心上会是不小的打击。特别是很多从应用开发转到机器学习的同学,毕竟在平常的工作中,大学的数学知识在实际的开发中应用的并不多,估计很多现在都已经生疏了。


对于机器学习,我推荐吴恩达在Coursera开设的机器学习课程,课程免费,侧重于基本的原理和工程实现,对初学者相对友好。字幕中英可选。
课程链接:


https://www.coursera.org/learn/machine-learning




深度学习


大家可能看过《一天搞懂深度学习》的PPT,作者是台湾大学的李宏毅老师。其实,李宏毅老师还有门深度学习的课程,视频也挂在网上。这门课主要针对初学者,不需要有经典的机器学习基础(其实,深度学习入门,比经典的机器学习更容易)。课程的内容深入浅出,训练和预测样本都是各种数码宝贝和二次元卡通人物,绝对让你耳目一新。没有字幕,中文授课(台湾腔)。
课程链接:


http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17.html




入门书籍

机器学习





《机器学习》


机器学习的入门书籍,当仁不让的就是周志华老师的西瓜书《机器学习》了。这本书基本囊括了绝大多数经典的机器学习方法。但坦白的讲,这本书入门也不是那么轻松,大量篇幅的数学推导和证明。建议初学者可以在第一遍的时候跳过具体的数学推导,更侧重在知识框架和原理的学习和提炼,后面可以通过第二遍或第三遍来深入其中的数学原理。


深度学习




《深度学习》


这一本称为目前深度学习领域的圣经,而作者们也确实做到了深入浅出,循序渐进。不是单纯的抛一个结论,而是逐步的深入,最终阐明原理。建议像《机器学习》一样使用:不要求第一遍就能全部吸收,可以先从框架和基本原理入手,跳过部分细节,后面再逐步深入。




数学基础

看前面的视频和书籍,对于很多从事应用开发的同学来说,可能最大的障碍就是对数学的恐惧。这种感觉大概就像没经历过算法训练的同学面对算法面试一样。其实,恐惧只要能直面它,那就一定能够克服掉。就好比LeetCode这样的OJ平台刷完200道左右的题目,再去面试算法一样。以前觉得是天大的障碍,现在回过头来,也不觉得有什么了不起。


我个人的经验是,通过前面的视频和书籍已经对机器学习和深度学习有了基本的系统框架和原理认识,同时,也积累了对数学知识进行系统复习的强烈欲望。这时候就可以有的放矢的复习大学知识了。数学知识的复习,我都是通过看网易公开课来完成的。


微积分


MIT《单变量微积分》:


http://open.163.com/special/sp/singlevariablecalculus.html


虽说是MIT的课程,但坦白的讲,老师的节奏真是比国内的课程还要慢,真正做到了通俗易懂


网易公开课还有MIT的《多变量微积分》,但我没有看,我觉得复习完单变量微积分,也就基本够用了。


线性代数


MIT《线性代数》
http://open.163.com/special/opencourse/daishu.html


这门课就没有上面的《单变量微积分》那么Nice了,老师思路跳跃性很强,稍一走神就不知道讲到什么地方了。但这门课有个很大的优点,就是从一开始就引入了向量空间的概念,而且贯穿始终。不像国内的课程,直到课程结束都以为线性代数只是求解方程组的另一种表达形式。


概率 / 统计


可汗学院《概率》
http://open.163.com/special/Khan/probability.html


可汗学院《统计学》
http://open.163.com/special/Khan/khstatistics.html


老实讲,可汗的公开课真是太细致了,细致到觉得拖沓(可能是复习,而不是初学者的缘故)。建议根据自己的需要做适当的跳跃。同时,两门课有部分内容是完全重合的,可以直接跳过。




Python

有了前面的基础相信你已经跃跃欲试了,但别急,工欲善其事必先利其器。可能你已经有MATLABC/C++Java的编程经验,但建议再入手一款新武器-Python。虽然前面的语言也可以用于机器学习和深度学习相关的研究和开发,但Python的使用范围更广,参考资料也更加丰富


我的自己经验是:

1.在网上找一篇Python入门的帖子,搭建环境,运行简单的例子(半天)


2.找一本基础书籍,系统的熟悉下语言的基本特性和完整框架(1~2天)(ps:我之前有C/C++和Java的语音基础)


3.开始正常使用Python进行开发,遇到问题,求助搜索引擎(2个月以上)


4.觉得自己对语言就基本的掌握后,可以根据选择进行进阶学习了



亲,花上面1~2天时间来系统的熟悉Python语言特性和语言框架,然后通过我推荐的python书籍来强化学习!



《Python基础教程》


(这本书很厚,初期把目录扫完就可以了,后面当做字典来使用)







Python基础教程




进阶阶段,推荐:


《流畅的Python》




流畅的Python



动手实践



好了现在我们终于可以动手实践了!


初级


《Python机器学习及实践:从零开始通往Kaggle竞赛之路》




Python机器学习及实践:从零开始通往Kaggle竞赛之路


这是很薄的一本书,但对于初学者实践来说却是非常棒的一本书。书中的大多数算法都是基于sk-learn来实现的。使用现成的Python库,而不用关心具体算法实现过程,可以快速体验机器学习算法的效果。同时,书的最后比较细致的介绍了Kaggle竞赛平台的使用,实战性更强


Python机器学习及实践:从零开始通往Kaggle竞赛之路》使用现成的Python库(工程中也大多是这样的)。但很多同学还是更希望能手工实现具体的算法,觉得这样基本功才扎实,那下面的这两本书就能很好的满足有这样想法的同学了。



进阶


《机器学习实战》




机器学习实战


经典的机器学习算法手工实现,书中包含大量的代码实例。但这本书出本的比较早,深度学习内容基本没有涉猎。针对这种情况,就有了下面这本的推荐:




《TensorFlow Machine Learning Cookbook》




TensorFlow Machine Learning Cookbook


这本书主要是基于TensorFlow的,手工编织网络。而且,书的内容就像它的名字一样,结构编排跟类似菜谱:开始前需要准备什么,开始后需要遵从哪些步骤,最后又会得到怎样的结果,条理非常清晰。目前这本书已经有了中文版。



领域应用

虽然我们花费了很长的时间,投入了很多精力,但我们目前的阶段仍然像做大学作业,跟真实的工业场景相差很远。那机器学习和深度学习在实际的AI场景是如何应用的呢?带着这样的问题,我推荐两本书:


《数学之美》







数学之美


吴军老师的经典之作。虽然这本书火的时候,AI都还没有现在这么火,但书中介绍的很多场景,使用的很多技术,基本都是来自我们学习的机器学习。




《统计自然语言处理》




统计自然语言处理


选择这边书是因为自己当前的工作跟自然语言处理相关。当然了,这也是自然语言处理领域非常经典的一本书,内容全面丰富。但学术的气息比较重,读起来又找到了当初读研看Paper的感觉。




杂项

比较正统的学习基本就算介绍完毕了。其实,除了上面的主线内容外,很多比较零散的资料,对于学习来说也还是很有裨益的。


《莫烦视频》


莫烦的个人主页有很多机器学习和深度学习相关的个人录制视频。以非常简洁的方式介绍了机器学习和深度学习相关的概念和框架,对初学者快速建立概念很有帮助(PS:92年的小鲜肉,真是不得了)
地址:https://morvanzhou.github.io/about/


《深度学习简化版》


形式跟莫凡的视频类似,是老外录制的。相比于莫烦的视频,内容更丰富多样,形式更新颖。通过YouTube播放,需要翻墙。
地址:https://www.youtube.com/watch?list=PLjJh1vlSEYgvGod9wWiydumYl8hOXixNu&v=b99UVkWzYTQ


《AI技术内参》


这是《极客时间》的一个付费专栏。主要推送AI相关的技术历史、当前行业信息和科研成果,从目前的使用情况来说,在品质上还是有保障的。


好啦,暂时就先这样吧,后面有更好的内容再更新,也欢迎大家分享自己的学习经验!


 












1.从AlexNet剖析—卷积网络CNN的一般结构


2.深度神经网络训练的必知技巧


3.[视频讲解]史上最全面的正则化技术总结与分析






扫描个人微信号,


拉你进机器学习大牛群。


福利满满,名额已不多…



80%的AI从业者已关注我们微信公众号


       


       






推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 提升Python编程效率的十点建议
    本文介绍了提升Python编程效率的十点建议,包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间,提高编程效率。同时,还提供了相关参考链接供读者深入学习。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 本文讨论了同事工资打听的话题,包括同工不同酬现象、打探工资的途径、为什么打听别人的工资、职业的本质、商业价值与工资的关系,以及如何面对同事工资比自己高的情况和凸显自己的商业价值。故事中的阿巧发现同事的工资比自己高后感到不满,通过与老公、闺蜜交流和搜索相关关键词来寻求解决办法。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了Linux Shell中括号和整数扩展的使用方法,包括命令组、命令替换、初始化数组以及算术表达式和逻辑判断的相关内容。括号中的命令将会在新开的子shell中顺序执行,括号中的变量不能被脚本余下的部分使用。命令替换可以用于将命令的标准输出作为另一个命令的输入。括号中的运算符和表达式符合C语言运算规则,可以用在整数扩展中进行算术计算和逻辑判断。 ... [详细]
  • 使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例
    本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤,可以获取到网站首页的新闻数据。代码示例使用Python编写,并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
author-avatar
公关活动策划公司_333
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有